A análise foi feita com base nos dados sobre as atividades dos representantes federais no twitter em 2019. Os campos utilizados aqui foram: o identificador do parlamentar, a casa, o partido, a UF, a quantidade de seguidores e o engajamento total(quantidade de likes e retweets para os tweets vistos).
atividade = read_projectdata()
tail(atividade)
## # A tibble: 6 x 19
## id_parlamentar casa nome_eleitoral partido UF twitter seguidores
## <chr> <chr> <chr> <chr> <chr> <chr> <dbl>
## 1 5899 sena… VANDERLAN CAR… PP GO Vander… 7065
## 2 5748 sena… VENEZIANO VIT… PSB PB venezi… 16045
## 3 1173 sena… WELLINGTON FA… PR MT sen_we… 5507
## 4 5411 sena… WEVERTON PDT MA wevert… 7821
## 5 5783 sena… ZENAIDE MAIA PROS RN zenaid… NA
## 6 3806 sena… ZEQUINHA MARI… PSC PA Zequin… 126
## # ... with 12 more variables: segue <dbl>, n_proprio <dbl>,
## # n_retweet <dbl>, engaj_total <dbl>, engaj_total_proprio <dbl>,
## # engaj_total_retweet <dbl>, engaj_mediano <dbl>,
## # engaj_mediano_proprio <dbl>, engaj_mediano_retweet <dbl>,
## # engaj_max <dbl>, engaj_max_proprio <dbl>, engaj_max_retweet <dbl>
Aqui pretende-se ver se a quantidade de deputados representando um partido torna-o mais popular no Twitter ou se poucos indivíduos podem despontar a quatidade de seguidores por todo partido. Além dos partidos, adicionou-se a informação do posicionamento ideológico para talvez identificar uma relação, adicional com o número de seguidores.
totais <- atividade %>%
filter(!is.na(seguidores) & casa == "câmara") %>%
summarize(n_politicos = n(),
n_seguidores = sum(seguidores))
seguidores <- atividade %>%
select(id_parlamentar, partido, seguidores) %>%
filter(!is.na(seguidores))%>%
group_by(partido) %>%
summarize(QntPoliticos = n(),
QntSeguidores = sum(seguidores),
Proporcao = round(QntPoliticos*100/totais$n_politicos, 2),
Seguidores = round(QntSeguidores*100/totais$n_seguidores,2))
Com exceção do PSOL, percebe-se que há linearidade entre a proporção de deputados federais do partido na câmara e a quantidade de seguidores, também por partido. O que não parece depender da ideologia
ggplotly(partido_posicao %>%
ggplot() +
geom_point(aes(x= Proporcao, text=sprintf("Partido: %s",partido), y = Seguidores, color = posicao), alpha=.7, size = 4))
Já se sabe que, de modo geral, a quantidade de seguidores cresce à medida que se aumenta a quantidade de seguidores para a câmara. Mas de modo geral, as pessoas participam igualmente dos twitter de representantes do mesmo partido? Ou a ideologia não é um fator tão importante quanto o indivíduo político?
atividade %>%
filter(!is.na(engaj_total)) %>%
select(id_parlamentar, partido, engaj_total) %>%
ggplot(aes(x=partido, y = engaj_total)) +
geom_boxplot() +
geom_point(alpha=0.2, color='orange') +
theme(axis.text.x = element_text(angle = 90)) +
labs(x = "Partido", y="Engajamento Total", title="Engajamento por partido")
A maioria dos partidos, como pode-se ver acima, possui engajamento uniforme com algumas exceções. Paulo Eduardo Martins, jornalista do PSC, Carla Zambelli, Bia Kicis, Joice Hasselmann, do PSL e Maria do Rosário, Gleisi Hoffmann, Enio Verri, do PT, por exemplo. Cada um indivíduos dissonantes dentro do seu partido.
Alguns estados são mais engajados do que outro, em média. Como esperado, estados populosos, como Rio de Janeiro e São Paulo, e o Distrito Federal são mais ativos. Amapá e Rio Grande do Norte, por outro lado, são surpresas pois aparecem acima de estados populosos como Bahia e Minas Gerais.
atv_total <- atividade %>%
select(UF, engaj_total) %>%
filter(!is.na(engaj_total)) %>%
group_by(UF) %>%
mutate(atv = mean(engaj_total)) %>%
distinct(UF, .keep_all = T) %>%
select(-engaj_total) %>%
arrange(UF) %>%
ungroup() %>%
mutate(regiao = c("NORTE", "NORDESTE", "NORTE", "NORTE", "NORDESTE", "NORDESTE", "CENTRO", "SUDESTE", "CENTRO", "NORDESTE", "SUDESTE", "CENTRO", "CENTRO", "NORTE", "NORDESTE", "NORDESTE", "NORDESTE", "SUL", "SUDESTE", "NORDESTE", "NORTE", "NORTE","SUL", "SUL", "NORDESTE", "SUDESTE", "NORTE"))
ggplot() +
geom_point(atv_total, mapping= aes(x=UF, y=atv, color=regiao), size = 3 ) +
geom_point(atividade, mapping= aes(x=UF, y=engaj_total), alpha = .08, color = 'navy') +
ylim(0, 250000) +
labs(title = "Engajamento do partido pelo estado e região do país", y = "Engajamento")
O vermelho é o total de atividade, likes e retweets, do partido e, em azul, as atividades individuais dos representantes. O resultado não é surpreendente, os representantes mais dissonantes vistos nos boxplots, provavelmente, puxam os valores dos seus partidos: PSL, muito acima dos demais, PT e PSOL.
atv_total <- atividade %>%
select(partido, engaj_total) %>%
filter(!is.na(engaj_total)) %>%
group_by(partido) %>%
mutate(atv = sum(engaj_total)) %>%
distinct(partido, .keep_all = T) %>%
select(-engaj_total)
ggplot() +
geom_point(atv_total, mapping= aes(x=reorder(partido, atv), y=atv), size = 3, color='red', alpha = .6 )+
geom_point(atividade, mapping= aes(x=partido, y=engaj_total), alpha = .1, color = 'navy') +
theme(axis.text.x = element_text(angle = 90)) +
labs(x = "Partido", y = "Atividade", title = "Atividade total por partido")